科研星球

Nature | 利用Biobank和FinnGen生物大数据库揭示人类疾病相关罕见蛋白质编码变异

近日,美国Biogen公司Heiko Runz研究组以及Benjamin B. Sun(第一作者)Nature上发表文章Genetic associations of protein-coding variants in human disease通过对英国生物样本银行以及FinnGen基因组数据库之间的关联分析,弥补了对于罕见变异与疾病之间的关联,为未来疾病相关生物学机制的研究以及药物开发提供了重要参考。


0.png

蛋白质编码以及非编码DNA的遗传变异在人类疾病的风险、发病和进展中发挥重要作用。一般来说,这些遗传变异相关的疾病可以分为两类,一类是由单个基因突变引起的疾病,具有高度外显性,危及人体的生存,而另外一类则是受到数百种低影响、非编码遗传变异的共同作用而导致疾病,通常被称为复杂疾病。近年来,群体生物库或者生物银行为疾病相关基因的发现立下了汗马功劳。生物库提供了同时对多种性状以及疾病研究的机会,也可以用于为之前认为不相关的表型与基因变异之间建立联系。

英国生物银行(UK Biobank,UKB)收集了50多万人基因数据以及相匹配的详细表型信息,自创建以来以前所未有的规模促进了生物医学的发现。作者们与合作者目前正在进行UKB参与者的外显子测序的工作,并将遗传发现与广泛的表型相联系。另外,作者们还创建了FinnGen(https://www.finngen.fi)数据库,该数据库基于学术行业合作,以芬兰人群体中基因型-表型之间的相关性,从而理解基因组是如何影响健康的。芬兰拥有完善的基因隔离体系以及独特的基因库,使得芬兰人有别于其他的欧洲人。芬兰人独特的单倍型结构特点是大量共同遗传的DNA处于连锁不平衡状态,并富含在其他种群中罕见的等位基因,即使在罕见和极罕见的等位基因频谱中,也可以从基因分型数据中高置信度地进行推断。

因此,作者们希望将英国生物样本银行以及FinnGen参与者进行全外显子测序,对蛋白质编码等位基因频谱以及744个疾病终点进行关联荟萃分析,由此作者们从中确定了975个基因遗传变异与疾病之间的关联,其中有超过三分之一先前未见报道。两个生物库的并行研究极大地扩展了对于罕见基因以及相关疾病的研究灵敏度,其中482个基因与148个疾病簇相关。举例来说,先前被发现与乳腺癌相关的CHEK2基因遗传变异被发现与罹患结直肠癌、甲状腺癌、子宫平滑肌瘤、良性脑膜肿瘤以及卵巢囊肿的风险均相关。通过变异携带者的相关疾病风险的定量分析,可以建立疾病相关等位基因,为人群中细致的致病性分析提供依据。

更进一步的,作者们利用在研究中发现的基因遗传变异对一系列不同的基因和信号途径进行了生物学研究,并以实例对该研究成果提供了应用的方向。首先作者们发现两个血凝固蛋白的罕见遗传变体与肺栓塞相关,除此之外,作者们发现一些多效性疾病位点,这些位点为多种疾病提供了生物学标记物,可以用于临床诊断依据药物开发。

总的来说,作者们通过对两个大规模人口生物库英国生物银行以及FinnGen进行了蛋白质编码关联研究分析,报告了大量新的疾病关联基因遗传变异,弥补了罕见以及低频率等位基因频谱与疾病发生的关联,同时系统性地确认了117个生物标志物水平与临床药物靶标。生物库的联合分析大大增强了疾病关联研究的能力,同时也为罕见基因变异引发的疾病提供了医疗研发的可能性。

原文链接:
https://doi.org/10.1038/s41586-022-04394-w


没有账号?